1
От вероятности к правдоподобию: Наука выводов
MATH003Lesson 6
00:00
Статистический вывод обозначает переход от прогнозирования исходов на основе известных параметров (вероятность) к определению тех параметров, которые наиболее согласуются с наблюдаемыми данными (правдоподобие). Если функция плотности вероятности $f(x|\theta)$ описывает распределение данных $x$ при фиксированном $\theta$, то функция правдоподобия $L(\theta|x)$ рассматривает наблюдаемые данные как фиксированные и изменяет параметр $\theta$, чтобы количественно оценить относительную поддержку различных гипотез.

Принцип инверсии

Функция правдоподобия часто выражается в виде совместной плотности. Для нормального распределения с фиксированной дисперсией правдоподобие определяется следующим образом:

$L ( \theta | x_1, \dots, x_n ) = \exp\left( -\frac{n}{2\sigma_0^2} (\bar{x} - \theta)^2 \right)$

Здесь мы оцениваем «правдоподобие» различных значений $\theta$ при заданном выборочном среднем $\bar{x}$. Чтобы найти пик этого правдоподобия, мы используем Определение 6.2.2: логарифм правдоподобия $l(\theta | s) = \ln L(\theta | s)$. Это преобразование упрощает произведения независимых наблюдений до сумм, делая максимизацию сложных моделей вычислительно осуществимой.

Работающий пример: Опрос роста (ПРИМЕР 6.3.5)

Данные

Рассмотрим выборку из $n=30$ ростов со стандартным отклонением $s=2.379$. Используя модель нормального распределения с местоположением и масштабом, мы стремимся определить истинное среднее значение $\theta$.

Выводы и точность

Стандартная ошибка рассчитывается как $s/\sqrt{30} = 0.43434$. Это значение измеряет «остроту» нашей кривой правдоподобия. Меньшая стандартная ошибка означает более узкий и острый пик, что указывает на большую точность наших выводов относительно $\theta$.

Размерность и ограничения

В сложных сценариях, таких как ПРИМЕР 6.1.5 (Мультиномиальные модели), мы должны учитывать логические зависимости. Как отмечено: «Обратите внимание, что это действительно двумерно, потому что как только мы знаем значение любых двух из $\theta_i$... мы сразу узнаём значение оставшегося параметра». Это ограничение крайне важно для правильного определения пространства параметров $\Omega$.

Асимптотические основания

Мост между правдоподобием и выводами опирается на центральную предельную теорему. При $n \to \infty$ распределение наших оценок сходится. Конкретно в случае ПРИМЕРА 6.5.4 Бернулли-модели:

$Z = \frac{\sqrt{n}(\bar{X} - \theta)}{\sqrt{\bar{X}(1 - \bar{X})}} \xrightarrow{D} N(0, 1)$

Это позволяет нам количественно оценить неопределённость с помощью интервалов z и значений p, при условии, что у нас достаточно большие выборки.

🎯 Основной принцип
Методы статистического вывода, не зависящие от распределения, требуют минимальных предположений о распределении выборки, что делает их устойчивыми при очень большой семье $\{P_{\theta} : \theta \in \Omega\}$. В отличие от этого, параметрические методы правдоподобия полагаются на кривизну логарифмической функции правдоподобия, где информация Фишера $nI(\theta)$ определяет дисперсию нашей функции оценки.